TOP 3
자치구 총생활인구수
16 송파구 753278.4966
0 강남구 633521.1274
3 강서구 533814.0426
“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

출처: 서울시 공공데이터포털 (https://data.seoul.go.kr/)
TOP 3
자치구 총생활인구수
16 송파구 753278.4966
0 강남구 633521.1274
3 강서구 533814.0426
TOP 3
자치구 1인가구수
4 관악구 150745
3 강서구 104509
16 송파구 87140
자치구
강남구 7007
관악구 5366
서초구 5060
Name: count, dtype: int64
자치구
강남구 1713
용산구 1421
구로구 1372
Name: count, dtype: int64
안전벨과 CCTV의 상관관계: 0.3032
예상과 달리, CCTV와 안전벨의 상관관계가 높지 않다.
치안센터와 경찰관 수의 상관관계: 0.6500
다른 변수들과 비교했을 때 가장 높은 상관관계를 보임
자치구 술집 수
17 양천구 3094
7 금천구 3179
10 동작구 3276
자치구 술집 수
12 서대문구 3578
7 금천구 3179
14 성동구 4001
술집 수와 총 범죄 건수의 상관계수: 0.8354
다른 변수들과 비교했을 때, 가장 높은 상관관계를 보임
상관계수 분석

범죄건수 주요 변수

상관 관계 높은 변수 임의 선택

VS Stepwise로 변수 선택
서울시 치안 기준 군집화
상관계수가 높은 변수를 활용해서,
비슷한 치안 특성을 가진 구를 찾기위해
저희는 K-Means 클러스터링을 사용했습니다.

K-Means 클러스터링이란?
유사한 특성을 가진 데이터를 자동으로 그룹으로 묶는 비지도 학습 기법
사용자가 군집 개수(K)를 정하면,
K개의 중심점을 기준으로 데이터를 그룹화하고,
각 데이터를 가장 가까운 중심점에 할당합니다.
중심점을 반복적으로 조정하며 유사한 데이터끼리 묶는 군집을 만듭니다.
서울시 자치구별 ‘구별_경찰수’, ‘유흥업소_개수’, ‘총생활인구수’, ‘cctv’ 등을 기준으로 치안 특성이 비슷한 지역을 자동으로 군집화하기 위해 사용했습니다.

하지만 분석 결과는…?

군집 개수를 2개로 정하고 군집 분석을 수행했습니다.
군집1
['강남구' '강서구' '마포구' '서초구' '송파구' '영등포구' '종로구' '중구']
군집2
['강동구' '강북구' '관악구' '광진구' '구로구' '금천구' '노원구' '도봉구' '동대문구' '동작구' '서대문구' '성동구'
'성북구' '양천구' '용산구' '은평구' '중랑구']

군집간 총 범죄건수의 평균에 차이가 있다.
| 클러스터 | 구별 경찰수 | 총 음식점 수 | 총생활인구수 | 파출소수 | 총범죄건수 |
|---|---|---|---|---|---|
| 1 | 1058.38 | 7468.25 | 464,404.93 | 12.38 | 9337.38 |
| 2 | 734.65 | 3824.71 | 377,246.14 | 8.41 | 5867.06 |